Brian老师的AI课程笔记

第1章【扬帆启程】深度求索：课程导学与AI基础

1 课程导学v2

第2章【行业概览】 LLM时代背景与应用价值，搜索+生成的时代

1 什么是大语言模型？（重制版）

2 大模型的应用？如何用好？找准方向

3 GPT系列与模型演进

4 LLM与传统NLP对比

5 大规模语料与训练挑战

6 【更新】大模型行业应用案例（MCP、Manus、Sora、v0）

7 大模型现存局限

第3章【初识DeepSeek】多模态与MoE核心特性

1 DeepSeek发展历程&模型核心特点

2 模型架构：MoE等核心要点

3 【资源推荐】大模型训练数据集与训练策略

4 与其他开源模型的比较（重视开源协议&商用授权）

5 【资源推荐】Deepseek版本+扩展应用+生态介绍

第4章【通用提示词能力】大模型“基石”，从聊天到精准AI交互

1 为什么要设计提示词：AI输出准确性

2 常见场景示例：翻译、摘要、润色

3 创意场景示例：文案营销、角色扮演

4 进阶场景示例：代码生成、逻辑推理

5 问题调试：如何改进不理想的输出

6 组合提示词：从简短到复杂的演练

7 【资源】提示词万词聚合网站

第5章【进阶应用】界面化工作流整合：让DeepSeek融入业务

1 AI工作流概念：自动化与协同

2 国内外常见工作流工具概览(Coze&Dify&Zapier)

3 Dify+Ollama本地部署实战（Docker部署）

4 工作流示例（一）：Dify+Deepseek实现网文摘要工作流

5 工作流示例（二）：智能客服-调用知识库

第6章【企业级开发准备】 AI编程环境与常用开发工具LLM应用案例

1 AI必备编辑器：Cursor&windsurf&trae

2 AI必备编程插件推荐Roo&Cline&WindSurf

3 在Cursor&AI插件中集成Deepseek大模型

4 桌面端工具：LMStudio&GPT4all&Cherry&ChatWise

5 【重要】离线环境下，是否可以使用AI编程？Ollama配置揭秘

6 案例1：如何自动编程？巧用Agents功能（工具案例）

7 6-6-1 Cursor账号白嫖方式&重置机器码脚本

8 案例2：长文写作技巧（角色植入、背景植入、写作手法植入）

9 案例3：RAG初体验-长文档会话工具（智能助手）

10 案例4：使用CherryStudio+ollama配置本地知识库

11 案例5：搭建智能助手：本地Dify知识库+Ollama本地模型

第7章【RAG根基】深度学习与Transformer剖析

1 Transformer 架构概览：原理演变与必备学习资源

2 从 Token 看概率：大模型如何理解语言与传统 NLP 区别

3 什么是 Embedding：文本到向量的转换原理

4 Transformer 自注意力机制解析

5 自注意力可视化、Embedding检索与微调生成

第8章【本地私有化】 DeepSeek部署与数据安全

1 【重要】模型硬件推荐与系统环境要求

2 [生产级]流行的模型推理框架vLLM&LMDeploy&ktransformers

3 【扩展】大模型国产化：硬件GPU服务商选择

4 GPU算力服务器租用方案（AutoDL&智星云&恒源云）

5 【AI脚本】Linux环境离线安装Ollama

6 【扩展】AutoDL外部数据上传方案（七牛云对接）

7 AutoDL+Ollama：大模型私有化部署实战(配合客户端演示)

8 Ollama 高阶实战：环境变量、模型路径与并发解析

9 别让模型裸奔！教你给 Ollama 加上 Token 安全锁

第9章【API实践】DeepSeek推理与多场景接入

1 AI开发环境准备：vscode插件+conda+pip国内加速源

2 模型调用入门：接口、参数、费用全解锁

3 多轮对话实战：用 Python 模拟 ChatGPT 式会话流程

4 模型响应提速关键：搞懂流式输出与实时解析

5 模型参数全掌握：温度、Top P、Token 配置与场景实战

6 聊天机器人实战：多轮会话、上下文管理与流式输出实战

7 【代码生成】RooCode实战：提示词驱动开发与调试实战

8 模型函数调用原理（对比MCP）

9 复杂函数调用实战：AI 生成 + VS Code 调试全流程解析

第10章【爆火AI工具】MCP 能力开发与接入实战全流程（纯扩展的）

1 理解 MCP：下一代模型能力调用平台与 Function Call 的对比实战

2 MCP 安装与服务选择指南+环境配置

3 常见问题：MCP加载失败如何解决？

4 常见问题：使用uv&pip来安装MCP服务

5 高质量 MCP 服务推荐：去哪里找、怎么选、哪些值得用

6 开发你的第一个 MCP 服务：协议理解、需求分析与入门实践

7 MCP开发环境搭建：mcp-starter初始化与调试实操

8 【AI协作开发】从提示词到可用 IP 查询接口的全流程实践

9 集成与发布：让你的 MCP 服务在 IDE 和 AI 插件中可用

第11章【搜索整合】 RAG原理与本地搜索方案

1 搜索增强入门：为什么大模型必须借助搜索？完整流程与原理解析

2 搜索服务推荐：Google、Bing、SerpAPI、百度全解析

3 实战 Google Custom Search：账号申请、API Key 管理与搜索接口开发

4 实战百度千帆搜索：接口开发、价格对比与搜索模式解析

5 搜索×工具×会话融合案例预览：构建智能聊天机器人的完整流程

6 实战打造智能聊天机器人：融合搜索、工具调用与多轮对话

第12章【本地化搜索方案】开源库与数据整合

1 【章导学】本地搜索介绍：本地检索、爬虫采集、元搜索

2 爬虫搜索演示：抓取百度&谷歌内容+解析搜索结果

3 本地搜索实现：轻量级爬虫开发+核心代码逻辑讲解

4 本地搜索调试：理解爬虫流程与搜索原理（扩展介绍crawl4ai）

5 【技术视野】元搜索与文档搜索引擎的对比

6 【进阶】元搜索方案SearxNG：容器化部署与接口调试

7 Elasticsearch本地化运行全流程实战

第13章【向量检索】解锁海量数据的高效检索之道

1 【章导学】RAG 核心技术概览

2 [基础]向量&向量空间概念解析

3 嵌入模型选型指南：基于 MTEB 榜单与场景需求筛选

4 从训练到检索：嵌入模型向量生成与相似度匹配原理

5 向量数据库选型指南：功能对比与场景落地

6 Chroma 实战：本地部署、数据写入与向量查询

第14章【编排实战】运用LangChain串联搜索与生成，打造智能工作流

1 LangChain入门全览：核心模块解析与环境准备

2 大模型模块：基础对话与流式响应输出

3 Prompt实践：构建结构化提示词并动态注入变量

4 Memory实战：构建有上下文记忆的对话系统

5 Tools：让模型拥有可调用的扩展能力

6 Agent实践：结合Prompt与Tools实现复杂决策调用

7 Chains实战：基础链、条件链、与顺序链

第15章【RAG进阶】搜索与向量数据库的深度结合

1 LangChain搜索工具实战：集成DuckDuckGo实现实时信息查询

2 【AI赋能】Langchain本地搜索：SearxNG+Agent实战

3 RAG数据工程起点：文档加载与结构化准备

4 RAG 数据工程核心：文本切分

5 RAG向量数据库实战：初始化+写入与查询全流程

6 RAG全流程实战：从文档到问答的闭环实现

第16章【多Agent协同】企业级搜索分析的强化，更灵活的知识与决策

1 智能体Agents：开发案例&执行流程揭秘

2 定制化agents：通过Prompt引导执行流程

3 多Agent协作实战：打造智能待办机器人

4 【进阶】案例演示：高仿ChatGPT深度研究

5 【进阶】深入研究agent实现（搜索+分析+报告）

6 n8n工作流技术方案介绍+资源推荐

7 n8n本地化docker部署+配置实战(镜像加速+激活许可)

8 技术学习方法论：AI辅助思考与实践反思

9 n8n自动化实战：HackerNews收集、AI 处理与日报邮件发送

10 智能日报流程优化(日期+邮件主题定制)

11 n8n子流程封装与测试：打造高复用自动化模块

12 【进阶】LLM 自主工具路由：多 Agent 子流程智能调度实战

13 【扩展】网页爬取方案：crawl4ai与社区节点解析

14 【更新】MCP Server与Client搭建：对接高德实现行程规划功能

15 【更新】MCP Stdio模式：配置 HackerNews MCP服务

第17章【可视化UI进阶】开源UI界面Open WebUI打造本地 AI 聊天系统

1 Open WebUI 安装与初体验：配合 Ollama 本地跑通模型

2 OpenWebUI实现多Agent对话功能

3 本地知识库实战：构建智能客服助手

4 联网搜索配置：接入SearxNG&DuckDuckGo

5 OpenWebUI三类函数功能解析

6 OpenWebUI容器化Docker部署+ Pipeline实战

7 开源聊天前端概览：NextChatWeb 与 LobeChat 快速对比入门

第18章【生产部署】高性能推理与容器化思路持续更新

1 为什么Ollama、LM Studio不适合生产场景

2 高性能推理框架对比：vLLM、LMDeploy

3 分布式与量化：大模型高效推理的关键

第19章【定制简易界面】开发测试用：Gradio/Streamlit打造交互体验持续更新

1 Gradio 快速原型：构建 LLM 页面并自动生成中文文档

2 Gradio 页面快速调试：热重载与重启实战

3 Gradio DeepSeek集成实战

4 Gradio接入Ollama本地模型流程与会话

5 Gradio本地模型对接与会话

6 Streamlit快速上手：安装+功能与Gradio 对比

7 Streamlit组件入门：侧边栏、控件、表格与可视化

8 Streamlit对接DeepSeek：大模型流式输出实战

9 Streamlit对接Ollama：本地模型加载与会话

第20章【接口并发】 API安全、限流与监控管理，如何效率+性能兼顾持续更新

1 并发与限流方案对比：AI 咨询落地实战

2 One API 集成实战：LLM 调用网关与分发方案

3 LLM底层API开发核心技术方案对比（Python&Node.js）

4 API网关与负载均衡：基础实现思路

5 全链路监控与日志选型（主流方案对比）

第21章【微调与扩展】让模型更贴近业务需求持续更新

1 微调入门：为什么要微调？主流方法与差异解析

2 Unsloth 微调实战：Colab 环境配置与代码详解

3 LlamaFactory：界面化微调全流程指南

第22章【课程回响】AI生成式课程笔记 × 教学内容RAG化实践持续更新

1 课程视频RAG项目概览：背景梳理与需求规划

2 本地视频转文字实战：Whisper模型部署与使用

3 通义听悟API集成实战：Cookie获取、音频上传与任务状态监控

4 封装工具Service：下载音频转写结果

5 批处理逻辑：对接待处理音频并创建测试逻辑

6 多格式下载优化：支持SRT&DOCX等文件类型并测试

7 n8n工作流实战：自动生成课程章节笔记与多Agent协作

8 n8n流程优化：高级提示词、输出命名与批量执行指南

9 n8n工作流：本地向量嵌入+Milvus部署

10 课程笔记助手：Milvus向量检索+Chat回答+格式化输出

11 课程助手：对外MCP服务配置指南

协议类型	风险点	典型案例
AGPL	云服务传染	MongoDB商业版转型主因
CC-BY-NC	禁止任何形式商用	艺术家模型Stable Diffusion
RAIL	伦理条款违约终止	Bloom的军事应用禁令

模型	协议类型	商用限制	更新状态	典型用户	硬件要求参考
DeepSeek	MIT	• 完全开放商用 • 允许闭源修改	✅ 2024	字节跳动/小米	8*A100(80G)
Llama 3	Meta许可证	• 月活≥7亿需授权 • 禁止托管API服务	⚠️ 受限	微软Azure/科研机构	4*A10(24G)
Qwen	阿里云协议	• 需企业实名认证 • 单独签署SLA	🔄 1.5	淘宝/钉钉	2*H800
ChatGLM	MIT	• 保留版权声明 • v3后停止新商业授权	⏸️ 暂停	招商银行/清华大学	1*RTX 4090
Bloom	RAIL许可证	• 禁用军事/监控 • 需签署伦理承诺书	✅ 稳定	联合国/NGO组织	4*T4(16G)
MPT	Apache 2.0	• 禁止违法用途 • 专利授权自动授予	✅ 稳定	美国政府部门	1*A100(40G)

模型系列	典型上下文长度	适用场景	硬件消耗参考
学习级（Llama2）	4K-8K	教学/实验	1*RTX 3090
生产级（Qwen）	32K	企业知识库	2*A10(24G)
超长文本（DeepSeek）	128K+	法律文档分析	8*A100(80G)

服务商	推理延迟	价格/百万token
OpenAI	350ms	$2.00
DeepSeek云	210ms	¥8.50

权重	评估维度	测试方法	工具支持
30%	基础能力	OpenCompass综合得分	自动评分
40%	业务场景匹配度	定制prompt测试集	Jupyter Notebook
30%	部署成本	推理速度/显存占用实测	NVIDIA Triton

场景	推荐模型	关键指标	硬件配置建议	典型客户案例
客服对话	DeepSeek-MoE-7B	• 响应速度<300ms	2*T4(16G)	京东智能客服
	千问-Turbo	• 多轮对话保持	1*A10(24G)	中国移动10086
企业知识库	DeepSeek-67B-131K	• 支持50MB单文档解析	8*A100(80G)	华为内部知识平台
	ChatGLM3-32K	• 准确率>92%	4*A10(24G)	招商银行文档中心
代码生成	DeepSeek-Coder-33B	• 工具调用成功率87%	1*RTX 4090	腾讯云开发者工具
	CodeLlama-34B-Python	• PEP8合规率95%	2*A100(40G)	GitHub Copilot竞品
金融分析	ChatGLM-金融版-6B	• 财报分析F1=0.89	1*A100(40G)	中信证券研报系统
	BloombergGPT(需授权)	• 市场预测准确率±3%	4*A100(80G)	高盛风险控制系统

优化手段	客服场景提升	知识库场景提升	代码场景提升
量化压缩(FP16)	35%速度↑	28%显存↓	22%速度↑
动态批处理	50%吞吐量↑	不支持	40%吞吐量↑
专家模型路由	60%准确率↑	45%准确率↑	33%准确率↑

模型规模	显存要求	推荐硬件	典型QPS	能效比(tokens/W)
7B	24-32GB	RTX 4090/AMD MI210	45	3.2
13B	40-48GB	2*A10/NVIDIA L4	28	2.1
70B+	320GB+	8*A100/H800	12	0.9
MoE	等效50%↓	4*A100(专家并行)	68	4.7

云厂商	特色功能	计费示例(70B模型)
阿里云PAI	弹性RDMA网络	¥28/小时
华为云ModelArts	Ascend NPU加速	¥35/小时
AWS SageMaker	Inferentia2芯片	$1.2/百万token

Brian老师的AI课程笔记

2-4 与其他开源模型的比较（重视开源协议&商用授权）

开源协议的重要性

商用风险本质

1. 法律风险放大效应

2. 品牌声誉风险

3. 供应链风险

核心规避原则

1. 学习场景自由边界

2. 商用审查四步法

3. 敏感领域特殊处理

协议深度解析

MIT协议优势

高风险协议警示

实践工具推荐

前沿动态

主流开源模型协议对比与深度解析

协议全景对比表

关键协议解析

1. MIT协议（DeepSeek/ChatGLM）

2. Meta许可证（Llama 3）

3. 阿里云协议（Qwen）

4. RAIL协议（Bloom）

协议选择决策树

前沿动态

实践建议

关键模型参数对比与选型指南

上下文窗口（Context Window）深度解析

核心指标对比

配置实操指南

长文本处理技巧

架构特性技术详解

Transformer架构

MoE架构（DeepSeek）

参数选型决策矩阵

前沿技术动态

性能优化实战

性能评测方法论与实战指南

评测工具深度解析

1. OpenCompass（中文特化）

2. HuggingFace Leaderboard

三维评测体系

1. 通用能力测试

2. 领域专项评测

3. 生产环境压力测试

选型实践进阶指南

1. 模型筛选矩阵

2. 领域冠军识别法

3. A/B测试框架

前沿评测技术

1. 动态基准测试

2. 对抗性测试

3. 能耗效率评估

常见问题解决方案

Q：测试结果与生产表现不符？

Q：如何测试超长上下文？

应用场景选型指南与优化策略

场景化模型选型矩阵

深度优化方案

1. 客服对话场景

2. 企业知识库增强

3. 代码生成专项优化

4. 金融分析精度提升

商用规避技术详解

知识蒸馏全流程

蒸馏实战代码

前沿场景解决方案

1. 多模态客服系统

2. 实时金融风控

3. 法律合同审查

性能优化对照表

常见问题应对

Q：如何处理超长合同文档？

Q：金融数据实时性要求？

部署实施要点与实战指南

硬件选型深度解析

显存占用计算公式

硬件配置对照表

异构计算方案

部署框架技术选型